有条件的随机测试(CRTS)评估了一个变量$ x $是否可以预测另一个变量$ y $,因为观察到了协变量$ z $。 CRT需要拟合大量的预测模型,这通常在计算上是棘手的。降低CRT成本的现有解决方案通常将数据集分为火车和测试部分,或者依靠启发式方法进行互动,这两者都会导致权力损失。我们提出了脱钩的独立性测试(饮食),该算法通过利用边际独立性统计数据来测试条件独立关系来避免这两个问题。饮食测试两个随机变量的边际独立性:$ f(x \ hid z)$和$ f(y \ mid z)$,其中$ f(\ cdot \ mid z)$是有条件的累积分配功能(CDF)。这些变量称为“信息残差”。我们为饮食提供足够的条件,以实现有限的样本类型误差控制和大于1型错误率的功率。然后,我们证明,在使用信息残差之间的相互信息作为测试统计数据时,饮食会产生最强大的有条件测试。最后,我们显示出比几个合成和真实基准测试的其他可处理的CRT的饮食能力更高。
translated by 谷歌翻译
杂散的相关性允许灵活的模型在培训期间预测很好,但在相关的测试人群中仍然很差。最近的工作表明,满足涉及相关诱导\ exuritiT {Nuisance}变量的特定独立性的模型在其测试性能上保证了。执行此类独立性需要在培训期间观察到滋扰。然而,滋扰,例如人口统计或图像背景标签通常丢失。在观察到的数据上实施独立并不意味着整个人口的独立性。在这里,我们派生{MMD}估计用于缺失滋扰下的不变性目标。在仿真和临床数据上,通过这些估计优化实现测试性能类似于使用完整数据的估算器。
translated by 谷歌翻译
通过最大可能性培训的深层模型已经为生存分析取得了最先进的结果。尽管采取了这一培训计划,从业人员可以在其他标准下评估模型,例如在选择的时间范围内的二进制分类损失,例如,如此。 Brier得分(BS)和Bernoulli日志似然(BLL)。由于最大可能性不直接优化这些标准,最大可能性培训的模型可能具有较差的BS或BLL。直接优化BS等标准需要通过审查分布逆加权,估计本身也需要失败分布的逆加权。但也不是众所周知的。为了解决这种困境,我们介绍了逆加权的生存游戏,以培训失败和审查模型以及BS或BLL等标准。在这些游戏中,每个模型的目标是由重量估计构建的,其中包含另一个模型,其中重新加权模型在训练期间固定。当损失是正确的时,我们表明游戏总是具有真正的失败和审查分布作为静止点。这意味着游戏中的模型不会留下正确的分布。我们构建一个静止点是独一无二的一个案例。我们表明这些游戏在模拟上优化了BS,然后在现实世界癌症和危险性患者数据上应用这些原则。
translated by 谷歌翻译